DataSense

SPSS+AMOS数据分析案例教程-关于中介模

SPSS视频教程内容目录和跳转链接

Mplus中介和调节教程

大学生问卷互填群

Meta分析辅导+代找数据

SPSS+AMOS数据分析案例教程-关于中介模

SPSS视频教程内容目录和跳转链接

R语言快速入门视频教程

LCA潜在类别分析和Mplus应用

Amos结构方程模型数据分析入门教程

倒U关系回归分析中介效应和调节效应分析SPSS视频教程

统计咨询(图文问答)

Statsmodels：[2]快速入门

2015年03月11日

文章目录

这是Python.statsmodels系列文章的第二篇，为了让大家快速入门，理解statsmodels工作的整个过程，我找到了一个很好的例子，在这里介绍给大家。下面我们来一步步介绍这个例子。

引入相关模块，pandas主要用到了他的DataFrame，sm用到了回归分析，patsy.dmatrices用于生成design matrix

Statsmodels：[2]快速入门

先获取数据，本例子用到的数据保存在网上的csv文件，我们可以使用pandas.read_csv方便的读取数据（url=’http://vincentarelbundock.github.com/Rdatasets/csv/HistData/Guerry.csv'）

Statsmodels：[2]快速入门

查看一下数据的前五行，有很多列，显示有点混乱

Statsmodels：[2]快速入门

Statsmodels：[2]快速入门

下面筛选出我们需要的列：
这是最后得到的数据：

Statsmodels：[2]快速入门

Statsmodels：[2]快速入门

由于最后一行有NaN值，所以需要使用dropna删除该行数据

Statsmodels：[2]快速入门

生成design matrix，我们建立的模型是y=BX，因此需要分别求得y和X矩阵，而dmatrices就是干这个的
这是y
这是X矩阵：我们会发现分类变量自动的转换成了哑变量

Statsmodels：[2]快速入门

Statsmodels：[2]快速入门

Statsmodels：[2]快速入门

OLS指的是一般最小二乘，fit方法对回归方程进行估计，summary保存着计算的结果
这是输出的模型的估计结果：

Statsmodels：[2]快速入门

Statsmodels：[2]快速入门

Statsmodels：[2]快速入门

现在我们要进一步检验数据是不是适合使用OLS，我们暂且先检验一下数据是否为线性，虚无假设是线性的，采用Rainbow test
输出结果为：第一个为F值，第二个为P值，显然未能拒绝虚无假设

Statsmodels：[2]快速入门

Statsmodels：[2]快速入门

接着，我们绘制偏回归线观察数据点是否分布在估计得到的直线的附近（图为控制了Rgion和Literacy后wealth对lottery的回归关系）

Statsmodels：[2]快速入门

Statsmodels：[2]快速入门

转载请注明来自DataScience.

邮箱: 675495787@qq.com

#statsmodels

统计咨询

统计咨询请加入我的星球,有问必回

加入星球向我提问(必回),下载资料,数据,软件等

赞助

持续创造有价值的内容, 我需要你的帮助